实用RAG系统：从知识库到检索增强生成：上下文困境：为何检索需要转化

这上下文困境源于一种根本性的架构不匹配：人类数据是 整体且无结构的，而大型语言模型（LLMs）则是 受限于标记数量且基于注意力机制的。若不进行转化，直接将原始数据输入大模型会导致“上下文污染”，即无关噪声会降低推理性能。

转化不仅仅是技术上的拆分；它是一项 战略性决策。分块不仅仅是文本分割。它是在选择检索所搜索的单元以及生成后续所消费的单元。这意味着分块同时影响召回率、排序、延迟、答案质量、令牌预算和引用可读性。